1
条件付き分布による関係の定義
MATH003Lesson 10
00:00
統計学におけるパラダイムシフトへようこそ。単なる「トレンドライン」の直感を超えて、厳密な 分布フレームワークに進みます。ここでは、相関係数だけで関係を定義するのではなく、予測変数 $X$ を変化させたとき、応答変数 $Y$ の確率的挙動にどのような変化が生じるかによって関係を定義します。

定義 10.1.1:統計的結合

2つの変数 $X$ と $Y$ は、 関連している 以下の場合には 任意の $x$ の値が変わることで、$X = x$ の条件下での $Y$ の条件付き分布に変化がある場合です。逆に、「関係なし」という状態は、$X$ と $Y$ が独立であることに数学的に等しいです。

論理的同等性

変数 $X$ と $Y$ が無関係であるのは、すべての $x$ に対して $f(y|x) = f(y)$ が成り立つ場合に限ります。これは、同時相対度数関数が次のように因数分解できることを意味します:

$$f(x, y) = f(x)f(y)$$

したがって、関係の有無を検証することは、本質的に 独立性の検定です。

変化のメカニズム

関係は、条件付き密度関数の任意のシフト(図10.1.1参照)によって特定されます。これには以下が含まれます:

  • 平均シフト: $Y$ に対する期待値 $E(Y|X)$ が変化する(最も一般的な焦点)。
  • 分散シフト: $Y$ のばらつきや不確実性が $X$ に依存する(異方性)。
  • 形状変化: 全体の分布が変化する(例:対称から非対称に)。

設計を通じた因果関係の確立

統計的な関係は因果関係を意味しません。$X$ が 原因である を引き起こすと主張するためには、交絡因子を考慮するために 実験設計を用いる必要があります:

  • コントロール処置: 比較のための基準を提供する。
  • プラセボ効果: 無効な処置によって、認識される改善を軽減する。
  • 盲検: 使用する ブランク実験 (被験者が無知)および ダブルブラインド実験 (被験者および研究者とも無知)によりバイアスを排除する。
  • ブロッキング: 例10.1.7に示されているように、 例10.1.7私たちはブロッキング変数($W$、土壌の肥沃度など)を使用して、小麦の種類($X$)と収量($Y$)の関係が事前の状態によって歪められないようにします。
🎯 核心的な数学的推定
これらの関係を推定するには 条件付き尤度 関数を使用します。離散データで頻度 $f_{ij}$ がある場合:
$$L = \prod_{i=1}^a \prod_{j=1}^b (\theta_{j|X=i})^{f_{ij}}$$ 標準誤差:$SE = \sqrt{\frac{\hat{\theta}_{ij}(1 - \hat{\theta}_{ij})}{n}}$